1
Cơ sở văn bản: Char so với Chuỗi trong Julia
AI015Lesson 5
00:00

Trong Julia, văn bản được xử lý thông qua hai thành phần kiến trúc khác nhau: loại Char 32-bit nguyên thủy và chuỗi không thể thay đổi, chuỗi mã hóa UTF-8. Khác với các ngôn ngữ nơi ký tự là một chuỗi độ dài 1, Julia xem xét Char là một kiểu số cấp cao đại diện cho điểm mã Unicode.

1. Phân cấp kiểu & Bộ nhớ

Cụ thể Char là một kiểu nguyên thủy 32-bit (thuộc kiểu con của AbstractChar). Loại dựng sẵn String (thuộc kiểu con của AbstractString) hỗ trợ toàn bộ phạm vi Unicode. Trong khi đó, một Char có kích thước cố định, String thì có chiều rộng thay đổi; từng ký tự chiếm từ 1 đến 4 byte, với điểm chuyển tiếp cho ASCII xảy ra tại $0x80(128)$.

2. Toán học & So sánh

Char đại diện cho một điểm mã số học, bạn có thể thực hiện các phép toán. Sử dụng Int('a') để nhận được 97 và Char(97) để nhận được 'a'. Các phép so sánh từ vựng được hỗ trợ: 'X' < 'x' là đúng vì chữ hoa đứng trước chữ thường trong Unicode.

Tính năngChar ('a')Chuỗi ("a")
KiểuCharString
Kích thướcCố định $32$-bitThay đổi UTF-8
Có thể thay đổiKhông áp dụng (kiểu giá trị)Không (không thể thay đổi)

So sánh nối như 'A' <= 'X' <= 'Y' được đánh giá là đúng hoặc sai dựa trên thứ tự Unicode.

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>